Demonstration von thematischen Frames im TopicExplorer-System

نویسندگان

  • Alexander Hinneburg
  • Frank Rosner
  • Stefan Peßler
  • Christian Oberländer
چکیده

Themenmodelle bieten sich an, die Inhalte großer Dokumentensammlungen zu erforschen. Thematische Wortlisten präsentieren typische Inhalte. Diese Themen werden automatisch gelernt, ohne das Dokumente manuell annotiert werden müssen. Während des Lernens eines Themenmodells werden die Wörter der Dokumente Themen zugeordnet. Dabei werden zwei gegenläufige Ziele verfolgt: erstens, einem Thema sollen so wenig wie möglich verschiedene Wörter zugeordnet werden und zweitens, ein Dokument soll so wenig wie möglich verschiedene Themen enthalten [2]. Die unüberwachten Lernalgorithmen finden Kompromisslösungen für diese Aufgabenstellung, welche im Fall von Variationsinferenz zu lokalen Extrema der freien Energiefunktion des Modells und im Fall von Gibbs-Samplern zu wahrscheinlichen Zuständen einer Markov-Kette korrespondieren. In keinem Fall garantieren die Algorithmen, dass die berechneten Themen gut durch Menschen interpretierbar sind. Es ist state-of-the-art die Themen, welche mathematisch gesehen Wahrscheinlichkeitsverteilungen über Wörtern sind, durch die wahrscheinlichsten Wörtern zu repräsentieren. Die Interpretation dieser Wortlisten kann jedoch eine schwierige Aufgabe für den Anwender sein. Eine erfolgreiche Interpretation hängt vom Hintergrundwissen der Person und der Vertrautheit mit dem genutzten Vokabular ab. Zwei wesentliche Probleme können die Interpretation eines Thema beeinträchtigen. Erstens, thematische Wortlisten können komplett aus Substantiven bestehen, deren Beziehungen zueinander mehrdeutig sein können. Ein Beispiel ist ein Thema, dass durch eine Liste von Ländernamen repräsentiert wird. Trotz dessen, dass alle Länder in einer eng umgrenzten Region liegen können, gibt es immer noch mehrere verschiedene Interpretationen, die zu einer solchen Liste passen würden. Deshalb ist sie nicht gut interpretierbar. Ein zweiter Grund kann darin liegen, dass die präsentierten Wörter dem Anwender als unzusammenhängend erscheinen. Dies kann an Wörtern liegen, die der Anwender nicht kennt. Es ist eine offene Frage, wie durch Themenmodelle berechnete Themen so repräsentiert werden können, dass sie klar und eindeutig durch Menschen interpretiert werden

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Methoden der räumlichen Generalisierung und Disaggregation im Kontext der GIS-gestützten explorativen Landschaftsanalyse

Die Moving-Window-Technologie ist eine Rahmenmethode zur Beschreibung der Verteilung von räumlich verteilten Objekten in der Landschaft. Über die Größe und Form des Analysefensters ist der Generalisierungsgrad skalierbar. An Beispieldaten aus dem Atlas für Farnund Blütenpflanzen Ostdeutschlands werden darauf basierende Methoden zur Generalisierung und Disaggregation im Vergleich mit konventione...

متن کامل

Design-Prozesse für computerunterstütztes kooperatives Lernen

Unser Forschungsprojekt WISSPRO – Wissensprojekt „Informatiksysteme im Kontext“ (http://www.wisspro.de) ist ein Verbundprojekt im Rahmen des bmb+f Förderprogramms „Neue Medien in der Bildung.“ WISSPRO fördert vernetzte Lerngemeinschaften in informatiknahen Studiengängen mit dem Ziel, die Präsenzlehre an den beteiligten Hochschulen durch die Umsetzung moderner didaktischer Konzepte und der Entwi...

متن کامل

GMA Annual Conference 2012 in Aachen - Conference Report

Grenzen überschreitenMedizinische Ausbildung International, Interprofessionell und Interdisziplinär, unter diesem Motto präsentierten, diskutierten und bearbeiteten die Teilnehmer an der diesjährigen Tagung der Gesellschaft für Medizinische Ausbildung vom 26. -29. September im Universitätsklinikum in Aachen aktuelle Themen aus den Bereichen der Medizinischen Ausbildung. In den Räumlichkeiten de...

متن کامل

StratIT - Ein Rahmenwerk zu den Inhalten von IT-Strategien. Grundlegung und methodische Fundierung

Bis heute ist kein Konsens über die Inhalte von IT-Strategien vorhanden. Daraus folgt eine gewisse Unsicherheit, wenn es gilt, die Themenbereiche einer IT-Strategie festzulegen. Dieser Missstand soll durch den Entwurf eines Rahmenwerks/Frameworks behoben werden. Die Fachgruppe Strategisches Informationsmanagement der Gesellschaft für Informatik (GI-Fachgruppe SIM) hat sich zum Ziel gesetzt, ein...

متن کامل

Empirische Untersuchung von emotionalen Reaktionen im Prozess der Informationsrecherche im Web

Mit dieser Arbeit wird ein Überblick über Konzepte und Forschungsergebnisse zur emotionalen Ebene bei der Web-Informationssuche gegeben und in einer qualitativen Studie eine beobachtende Perspektive auf affektive Phänomene entlang des Websuchprozesses eröffnet. Eine Literaturanalyse identifiziert Unsicherheit, Nutzerzufriedenheit, Selbstwirksamkeit, Flow und Coping als relevante Erklärungskonze...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2014